06. 图像分类流程
图像分类流程
图像分类流程
图像分类器是一种将图像作为输入,并输出标识该图像的标签或“类”的算法。例如,交通标志分类器将查看不同的道路,并能够识别该道路是否包含人类、汽车、自行车等。根据其内容对每个图像进行区分和分类。
用来识别特定对象甚至是行为-比如一个人是否在走路或跑步-的分类器有很多种,但是它们都涉及到一系列类似的步骤。
- 首先,计算机从相机等成像设备接收视觉 输入 。这通常被捕获为图像或图像序列。
-
然后通过一些
预处理
步骤发送每个图像,其目的是使每个图像标准化。
常见的预处理步骤包括调整图像大小或旋转图像,以改变其形状 或 将图像从一种颜色转换为另一种颜色 - 如从彩色到灰度。
只有通过标准化每个图像,例如:使它们大小相同,从而进行比较,并进一步以同样的方式进行分析。 - 接下来,我们 提取特征 。特征是帮助我们定义某些对象的东西,它们通常是关于对象形状或颜色的信息。例如,将汽车与自行车区分开来的一些特征是,汽车通常具有更大形状,并且其轮子有四个而不是两个。汽车的形状和车轮是其特征。我们稍后会在本课中详细讨论特征。
- 最后,这些特征被输入一种 分类模型 !这一步可观察上一步的任何特征,并预测这个图像是汽车还是行人或自行车,等等。
你将手动编程每个分类步骤,以便你 真正 理解每一步。
这里的数据集可以参考 https://github.com/CheneyZeng/intro2car_p5
到本课结束时,你将拥有完成最终项目所需的所有技能:构建交通灯分类器,该分类器将红绿灯的图像分成三类:红灯、黄灯或绿灯。